sql - Sum on a left join SQL

SQL/HIVE - 不同计数查询 - SELECT COUNT (DISTINCT columns,..) 与 SELECT COUNT(*) 与 DISTINCT 记录的子查询有何不同

在HIVE中，我尝试使用2种方法获取不同行的计数，SELECTCOUNT(*)FROM(SELECTDISTINCTcolumnsFROMtable);SELECTCOUNT(DISTINCTcolumns)FROMtable;两者都产生了不同的结果。第一个查询的计数大于第二个查询。他们的工作方式有何不同？提前致谢。最佳答案对您的查询做一点小改动，例如将您的子查询命名为:SELECTCOUNT(*)FROM(SELECTDISTINCTcolumnsFROMtable)myquery;

sql - 使用一条插入语句在多个分区中插入数据

我有表A和表B，其中B是A使用名为X的字段的分区表。当我想从A向B插入数据时，通常会执行如下语句:INSERTINTOTABLEBPARTITION(X=x)SELECTFROMAWHEREX=x现在我想要实现的是能够插入一系列X，比方说x1、x2、x3...我怎样才能在一个语句中实现这一点？最佳答案使用动态分区加载:sethive.exec.dynamic.partition=true;sethive.exec.dynamic.partition.mode=nonstrict;INSERTOVERWRITETABLEtable

插入语 sql section code partition hadoop hive hiveql hive-partitions

java - "sql like"apache 配置单元的替代品

我正在寻找一个支持类似于sql查询的分布式数据库的解决方案。更准确地说，它应该有一个JDBC连接器和与sql语法相同或相似的语法。通过谷歌搜索，我发现了HIVEwithhadoop。您还知道哪些其他选择？最佳答案 ClouderaImpala是一个支持类SQL查询并与HiveQL兼容的框架。虽然Hive已经存在一段时间并且面向批处理，但Impala是新的并且适合实时处理。不确定JDBC是否与Impala一起工作。关于java-"sqllike"apache配置单元的替代品，我们在St

配置单替代品 section Impala stackoverflow java jdbc hadoop distributed hive

sql - 选择 Hive 表中的第一个匹配项

我在hive上有一个表A，如下所示:idmstsaction1231000sleep1231010eat1232001sleep4561200eat4561500drink我想要的是为每个id选择与min(tmst)对应的整个集合。我可以通过运行select*fromAt1semileftjoin(selectid,min(msts)asmstsfromAgroupbyid)t2ont1.id=t2.idandt1.msts=t2.msts;但我想看看我是否可以在没有连接(或自定义reducer)的情况下完成它，因为它很耗时。编辑:澄清一下:我想要得到的是每个id执行的第一个操作(ac

Hive sql code section msts hadoop

mysql - 分组并选择最大对 SQL

我有一个包含两列的表格。createtabletxns(personvarchar(255),fruitvarchar(255));这是一个日志表。我有sqlfiddlehere.这是我能够通过sql查询获得的信息。本质上，对于每个人来说，这是他吃过最频繁的水果。我家里有Oracle和MySql。将来，它也会部署在hadoop上(通过Hive/Impala等)。因此，非以数据库为中心的答案将是最好的。但如果只有这样的话，请也提供一个以数据库为中心的答案。最佳答案以下查询将在Oracle和MySQL中运行。selectk.pers

mysql SQL person section fruit oracle hadoop

mongodb - 我们对 mongodb 使用 nosql 就像对 oracle 使用 sql 一样？

关闭。这个问题需要detailsorclarity.它目前不接受答案。想改进这个问题吗？通过editingthispost添加细节并澄清问题.关闭8年前。Improvethisquestion我将以我的问题为例。如果我们使用ORACLE作为数据库，如果我们想从中获取数据，我们应该知道的是SQL。在sql的帮助下，我们可以从oracle中获取数据。如果我们使用Mongodb作为数据库，我们是否必须了解NoSql。？？简单来说。用于ORACLE的SQL。和MongoDB的NoSql？我说得对吗？

mongodb oracle section class notice hadoop database nosql

oracle - 使用 Spark 查询 Oracle DB 时出现 "ORA-00933: SQL command not properly ended"错误

我尝试使用Spark数据源API从Oracle数据库加载数据。因为我需要通过查询加载数据，所以我使用了下面的查询，这是我从网上的一些例子中整理出来的:Mapoptions=newHashMap();options.put("driver",MYSQL_DRIVER);options.put("user",MYSQL_USERNAME);options.put("password",MYSQL_PWD);options.put("url",MYSQL_CONNECTION_URL);options.put("dbtable","(selectemp_no,emp_idfromemploy

时出 amp 34 options section oracle scala hadoop apache-spark

sql - 如何在 HIVE 中查找以前的日期

我想在Hive中查找之前的日期。例如:我的日期为20180821(yyyyMMdd)格式，我想在Hive中查找此日期的前一个日期。我尝试了date_sub()函数，似乎它只适用于yyyy-MM-dd格式。如何解决我的问题。请帮忙最佳答案除了已经提供的带有unix_timestamp转换的解决方案外，还请考虑这个。使用substr()的相同转换看起来有点长，但它适用于任何日期/时间戳，如'1969123119:00:00'而没有TZ问题，也这并不慢，因为没有使用SimpleDateFormat/etc也没有应用TZ。date_su

何在 HIVE code section 20180821 sql date hadoop hiveql

sql - 如何在 Hive 中生成所有 n-gram

我想使用HiveQL创建一个n-gram列表。我的想法是使用具有先行和拆分功能的正则表达式-但是这不起作用:selectsplit('Thisismysentence','(\\S+)+(?=(\\S+))');输入的是表格的一列|sentence||-------------------------||Thisismysentence||Thisisanothersentence|输出应该是:["Thisis","ismy","mysentence"]["Thisis","isanother","anothersentence"]Hive中有一个n-gramudf，但该函数直接计算n

中生何在 sentence code 34 sql hadoop hive hiveql n-gram

sql 时间函数

1，前提今天看同事写的sql里面出现了时间类的函数，平时自己也经常用到，每次都要百度，还不如自己整理记录在一起，方便后续使用。2，sql时间函数2.1获取当前时间：select NOW()as'当前日期+时间', CURDATE()as'当前日期', CURTIME()as'当前时间';2.2获取单个年月日时分秒SELECTYEAR(now())AS'年',MONTH(now())AS'月',DAY(now())AS'日',HOUR(now())AS'时',MINUTE(now())AS'分',SECOND(now())AS'秒',DAYNAME(now())AS'星期';2.3格式化日期SE

函数时间 span class token sql 数据库